En este reporte analizaremos el uso del sistema Ecobici en la Ciudad de Buenos Aires durante el año 2022.
Utilizaremos un dataset específico que consta de 10,000 observaciones seleccionadas de un conjunto de datos mucho más extenso, compuesto por casi 3 millones de registros. Este dataset nos permitirá examinar patrones y tendencias en la utilización de Ecobici. Además, complementaremos este análisis con datos meteorológicos y climáticos de la estación meteorológica de Aeroparque (ID 87582), recopilados desde el 1ro de enero hasta el 31 de diciembre de 2022.
La integración de estos conjuntos de datos nos brindará una visión enriquecedora para comprender mejor la relación entre el uso de Ecobici y las condiciones climáticas en la Ciudad de Buenos Aires
Esta conformado por las siguientes columnas:
fecha: fecha del registro.
tmin, tavg ,tmax: Temperaturas minima, maxima, y promedio del dia.
prcp: Precipitacion en mm.
wdir, wspd: Direccion y velocidad del viento respectivamente.
pres: Precion atmosferica en hPa.
Tambien teniamos las columnas snow wpgt y tsun las cuales decidimos quitar porque estaban compuestas al 100% de nulos asi como tambien reemplazar los nombres de las columnas por algo mas claro.
Esta conformado por las columnas:
id_recorrido, id_usuario: keys para identificar cada viaje y usuario distinto
duracion del recorrido: cuanto duro el viaje (en segundos).
latitud / longitud de estacion origen/destino y nombres de las estaciones : datos geograficos sobre la ubicacion y el nombre de cada estacion
modelo_bici: que bici estaban usando.
genero: de que genero era el usuario.
fecha origen/destino, fecha: que dia y a que hora partio/llego y fecha del registro
Decidimos quitar el resto de las columnas ya que eran datos repetidos como la direccion o eran columnas de indice de cuando se redujo del dataset original.
Comenzamos analizando la temperatura.
La temperatura mas alta ocurrio en enero (37°C) y la mas baja en julio (2.3°C). Veamos las lluvias.
Se puede ver que hubo mayores precipitaciones en Febrero.
Hubo vientos mas fuertes en verano que en invierno.
Si bien hubo mayor presion atmosferica en invierno, no vario mucho.
Veamos como se ven afectados los viajes en el Dataset
Analicemos cual es el horario en que se concentra la mayor cantidad de viajes.
Podemos ver que el horario de mayor concentración de viajes es entre las 16 y 18hs
Ahora analicemos para cada mes
Observamos que la tendencia se mantiene, exceptuando el mes de enero. Analicemos la cantidad de viajes a lo largo del año para ver si la cantidad de viajes disminuye en enero
La cantidad de viajes disminuye en el verano y el invierno siendo los puntos mas bajos las semanas del 9-1 al 29-1 en el verano y las semanas del 17 de julio y 31 julio en el invierno.
Por el contrario hay mas viajes en otoño y primavera, siendo la semana del 10 de abril y del 2 de octubre las semanas en las que hubo mas uso.
Respecto al análisis que veniamos haciendo, la cantidad total de viajes disminuye en enero y eso va de la mano con esa disminución de amplitud en el horario pico. Como dato llamativo, en invierno esa disminución en el horario pico, si bien también se da y coincide con la disminución en la cantidad total de viajes, esa disminución de amplitud en el horario pico es mucho mas leve.
Se puede observar que mientras mas llueve hay menos viajes.
Hay menos viajes los fines de semana, veamos si es todos los meses
No varia mes a mes
Podemos ver que en enero Plaza irlanda estaba primera, en febrero Guatemala, en marzo abril y mayo congreso y constitucion.
En Julio Malabia y Azucena eran las mas populares, Pacifico estuvo entre las mas populares de agosto a octubre y Constitucion Topeo en diciembre, es posible que se deba a que se creia que iba a pasar la selecciónpor ahi cuando ganaron el mundial.
Ya en el primer semestre podemos ver como varia, en enero la estacion de origen mas usada es es Pacifico, pero febrero ya esta compartiendo el puesto con Plaza Bolivia. En marzo la mas usada fue Plaza Italia, el abril Retiro, en mayo un empate entre Congreso y Facultad de medicina y en junio Acuña de figueroa fue la mas usada.
En el segundo semestre podemos ver mejor la tendecia que aparecia cuando tomabamos todo el año, a excepcion de julio y septiembre donde las mas usadas fueron Plaza Italia y Hospital de clinicas respectivamente, podemos ver que las 3 estaciones de origen mas usadas (Pacifico, Retiro y Constitucion) dominan en los otros meses.
Hay 348 outliers con mas de 45mins de recorrido
la mayoria de las personas usa las bicis por menos de 45min
El tiempo promedio de uso es de 18 mins 42segs.
El tiempo medio de uso es de 16mins con 4 seg.
En invierno el promedio y la media de duracion de recorridos es mas baja.
En abril se ve que hubo una bajada en el tiempo de recorrido maximo y upper fence
Los viajes duran mas los fines de semana.
Las lluvias no parecen afectar del todo a las duraciones de los viajes.
Hay una leve tendencia hacia mas duracion a mas calor, pero es muy pequeña.
En conclusión, se puede ver una relación entre la temperatura y la cantidad de viajes ese día.
En particular, se puede observar que si la temperatura promedio es menor a 10°C o mayor a 25°C, la cantidad de viajes ese día disminuye.
Podemos observar que el género masculino tiene una mayor proporción de repetición de viajes
Vamos a analizar cuales son los modelos de bicicletas mas utilizados y si hay algún patrón relacionado con otras variables
No se ve diferencia mas que el modelo mas utilizado es el modelo FIT.
Analicemos el uso de cada modelo para ver si hay algun dia de la semana en que un modelo sea mas elegido que otro
La proporción parece mantenerse independientemente del dia de la semana.
Veamos si hay algún modelo que sea preferido en base al género.
La proporción parece mantenerse independientemente al genero.
Este análisis nos ha brindado una comprensión valiosa sobre la utilización del sistema Ecobici en la Ciudad de Buenos Aires durante el año 2022. A continuación, se presentan algunos hallazgos significativos derivados del análisis:
La franja horaria con mayor concentración de viajes es entre las 16:00 y las 18:00 horas. Este patrón se repite en todos los meses, excepto en enero. Es probable que esto se deba a la cantidad de lluvias, así como a un aumento significativo de la temperatura, factores que hemos observado que influyen en la cantidad de viajes. Es posible que las vacaciones también tengan un impacto temporal, aunque no disponemos de datos sobre esta variable.
La cantidad de viajes es mayor durante las temporadas de otoño y primavera, mientras que disminuye durante el invierno y el verano. Según nuestras observaciones, tanto las temperaturas extremadamente altas como bajas afectan la cantidad de viajes.
La mayoría de los viajes se concentran en la zona noreste y en el centro de la ciudad.
Las estaciones de salida más comunes son Constitución, Retiro y Pacífico, lo que indica un uso significativo de la combinación tren-bicicleta.
La duración promedio de un viaje es de 18 minutos y 42 segundos. Es más probable que las personas de género masculino realicen viajes repetidos.
Durante los fines de semana, hay menos viajes, pero estos son de mayor duración.
Hay mas viajes con el modelo FIT, y esto mantiene por el día de la semana y por el género.
Esta integración de datos y el análisis resultante pueden ser fundamentales para informar estrategias futuras y mejorar la eficiencia y accesibilidad del sistema Ecobici en la ciudad.